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Datele trebuie procesate cu instrumente avansate de colectare şi analiză, pe baza unor 
algoritmi prestabiliţi, pentru a putea obţine informaţii relevante. Algoritmii trebuie să ia în 
considerare şi aspecte invizibile pentru percepţiile directe. 

în 2004 Google a publicat o lucrare despre un proces numit MapReduce care oferă un 
model de procesare paralelă. (Dean and Ghemawat 2004) De asemenea, MIKE2.0 este o aplicaţie 
în sursă deschisă pentru managementului informaţiilor. (MIKE2.0 2019) Mai multe studii din 2012 
au arătat că arhitectura optimă pentru a aborda problemele din Big Data sunt cele cu mai multe 
straturi. O arhitectură paralelă distribuită distribuie date pe mai multe servere (medii de execuţie 
paralelă) putându-se îmbunătăţi astfel dramatic vitezele de procesare a datelor. 

Conform unui raport al Institutului Global McKinsey din 2011, principalele componente 
şi ecosisteme ale Big Data sunt: (Manyika et al. 2011) tehnici de analiză a datelor (învăţarea 
maşinilor, prelucrarea limbajului natural, etc.), tehnologii de mari dimensiuni (business 








intelligence, cloud computing, baze de date), şi vizualizări (diagrame, grafice, alte afişări ale 


datelor). 

Big Data furnizează informaţii în timp real sau aproape real, evitându-se astfel latenţa ori 
de câte ori este posibil. 


Aplicaţii 

Big Data în procesele guvernamentale cresc eficienţa costurilor, productivitatea şi inovaţia. 
Registrele civile sunt o sursă pentru Big Data. Datele prelucrate ajută în domenii critice de 
dezvoltare, cum ar fi îngrijirea sănătăţii, ocuparea forţei de muncă, productivitatea economică, 
criminalitatea, securitatea şi gestionarea dezastrelor naturale şi a resurselor. (Kvochko 2012) 

De asemenea, Big Data oferă o infrastructură care este pennite evidenţierea 
incertitudinilor, a performanţei, şi disponibilitatea componentelor. Tendinţele şi predicţiile în 
industrie necesită o cantitate mare de date şi instrumente avansate de predicţie. 

Big Data contribuie la îmbunătăţirea asistenţei medicale prin furnizarea de medicamente 
personalizate şi analize prescriptive, intervenţii clinice cu evaluarea riscurilor şi analize predictive, 
etc. Nivelul datelor generate în sistemele de sănătate este foarte mare. Dar există o problemă 
presantă cu generare de "date murdare", care cresc odată cu creşterea volumului de date, mai ales 
că cele mai multe sunt nestructurate şi greu de utilizat. Utilizarea Big Data în domeniul asistenţei 
medicale a generat provocări etice semnificative, cu implicaţii asupra drepturilor individuale, viaţa 
privată şi autonomia, transparenţa şi încrederea. 

în media şi publicitate, pentru Big Data se folosesc numeroase puncte de infonnare despre 
milioane de persoane, pentru a servi sau transmite mesaje sau conţinuturi personalizate. 

în domeniul asigurărilor de sănătate se colectează date despre "factorii determinanţi ai 
sănătăţii", care ajută la elaborarea de previziuni privind costurile de sănătate şi identificarea 



problemele de sănătate ale clienţilor. Această utilizare este controversată, datorită discriminării 
clienţilor cu probleme de sănătate. (Allen 2018) 

Big Data şi tehnologia infonnaţiei se complementează reciproc, ajutând împreună la 
dezvoltarea Intemetului Lucrurilor (Internet of Things, IoT) pentru interconectarea dispozitivelor 
inteligente şi colectarea datelor senzoriale utilizate în diferite domenii. 

în sport, Big Data poate ajuta la îmbunătăţi pregătirii şi înţelegerea concurenţilor utilizând 
senzori specifici, şi se poate prezice performanţa viitoare a sportivilor. Senzorii ataşaţi maşinilor 
din Formula 1 colectează, printre altele, date din presiunea în anvelope pentru a eficientiza arderea 
combustibilului. 

în cercetare 

în ştiinţă, sistemele Big Data sunt folosite intens în acceleratoarele de particule de la CERN 
(150 de milioane de senzori transmit date de 40 de milioane de ori pe secundă, pentru cca 600 de 
milioane de coliziuni pe secundă, din care se utilizează după filtrare doar 0,001% din totalul datelor 
obţinute), (Brumfiel 2011) în telescoapele radio astrofizice construite din mii de antene, 
decodificarea genomului uman (iniţial a durat câţiva ani, cu Big Data se poate realiza în mai puţin 
de o zi), studii climatice, etc. 

Marile firme IT utilizează depozite de date de ordinul zecilor de petabyte pentru căutare, 
recomandări şi merchandising. Cele mai multe date sunt colectate de Facebook, cu peste 2 miliarde 
de utilizatori activi lunar, (Constine 2017) şi Google cu peste 100 de miliarde de căutări pe lună. 
(Sullivan 2015) 

în cercetare se foloseşte mult căutarea criptată şi formarea clusterelor în Big Data. Ţările 
dezvoltate investesc enorm în prezent pentru cercetare în Big Data. în cadrul Uniunii Europene, 
aceste cercetări sunt înglobate în programul-cadrul Orizont 2020. (European Commission 2019) 



Adesea, programele de cercetare folosesc resursele API de la Google şi Twitter pentru a 


obţine acces la sistemele lor Big Data, gratuit sau contra cost. 

Seturile mari de date vin cu provocări algoritmice care anterior nu existau, fiind imperios 
necesar să se schimbe în mod fundamental modalităţile de procesare. Pentru aceasta s-au creat 
ateliere speciale de lucru care reunesc oameni de ştiinţă, statisticieni, matematicieni şi practicieni 
pentru a discuta despre provocările algoritmice ale Big Data. 
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